تخمین اطمینان خروجی ترجمه ماشینی با استفاده از ویژگی های جدید ساختاری و محتوایی
Authors
Abstract:
Despite machine translation (MT) wide suc-cess over last years, this technology is still not able to exactly translate text so that except for some language pairs in certain domains, post editing its output may take longer time than human translation. Nevertheless by having an estimation of the output quality, users can manage imperfection of this tech-nology. It means we need to estimate the confidence of the output without having any references. Moreover, Confidence Estimation (CE) can be useful for some applications that their goal is to improve machine translation quality such as system combination, regener-ating, pruning, etc. but there is not yet any completely satisfactory method for CE task. We propose 5 groups of syntactic and lexico-semantic features. The results show that the lexico-semantic feature outperforms the best baseline system (2) by 9.63% in CER, 8.5% in F-measure and 5.1% in negative class F-measure. Also by combining proposed syn-tactic features together we reach 4.59% CER reduction, 4.1% F-measure improvement and 2% negative F-measure improvement.
similar resources
تخمین اطمینان خروجی ترجمه ماشینی
به دلیل ابهام ذاتی موجود در زبان طبیعی، تقریبا همه فناوری های پردازش زبان طبیعی ناکاملند. با این حال با تخمینی از کیفیت خروجی، کاربران می توانند به طور مناسبی با ناکامل بودن آنها برخورد کنند. زمینه تحقیقاتی که به این مسئله می پردازد تخمین اطمینان نامیده می شود. هدف اصلی تخمین اطمینان کاربردی تر کردن فناوری های ناکامل است. در حوزه ترجمه ماشینی نیز با وجود پیشرفت های به دست آمده در سال های اخیر، ...
15 صفحه اولنگرشی بر ترجمه ماشینی
از دیر باز بشر همیشه در آرزوی اختراع دستگاهی بوده است که بتواند متون را از زبان مبداء به زبان مقصد با سرعت و دقت فراوان ترجمه کند. تلاش برای رسیدن به این آرزو بیش از پنج دهه است که آغاز شده است و محققان دسا اوردهایی در زمینه طراحی سیستم ها و ساخت ماشین های مترجم بدست آورده اند ولی نام ماشینهای مترجم همواره مفهوم منفی را در ذهن افراد تداعی می کند و بیشتر مترجمان و محققان نظر منفی درباره ماشینهای...
full textخوشهبندی محتوایی-ساختاری گراف و معیاری جدید جهت ارزیابی آن
امروزه با گسترش شبکههای اجتماعی در بین مردم، تلاشهای مخالفین برای بدبین کردن ایشان نسبت به حکومت که از آن به عنوان جنگ نرم یاد میشود افزایش یافته است، بنابراین توجه به این شبکهها برای ارگانهای نظامی و امنیتی بیش از پیش اهمیت دارد. خوشهبندی گراف از جمله اولین کارهای تحلیلی یک یا چند شبکه اجتماعی است. متأسفانه اکثر خوشهبندیهای گرافی انجام شده بر روی جنبههای ساختاری یا محتوایی گرههای گرا...
full textترادف نوکلئوتیدی و ویژگی های ساختاری دو واریانت جدید ویروئید کوتولگی رازک از مرکبات استان فارس
ویروئید کوتولگی رازک (HSVd) در سال های اخیر به عنوان عامل همراه با بیماری های زرد و چوب پنبه ای شدن رگبرگ در درختان پرتقال واشنگتن ناول و شقاقی شدن پوست لیموشیرین از مرکبات استان فارس و به عنوان عامل بیماری کاککسیای مرکبات از استان مازندران گزارش گردیده است که نشان دهنده اهمیت این عامل بیماری زا در ایران است. در این مطالعه تعدادی نمونه بدون علائم مشخص از باغ های مرکبات استان فارس از نظر وجود وی...
full textMy Resources
Journal title
volume 12 issue 3
pages 109- 121
publication date 2015-12
By following a journal you will be notified via email when a new issue of this journal is published.
No Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023